软考真题
第1题
(共15分)
阅读以下说明和流程图, 填补流程图中的空缺(1) -(5) ,将解答填入答题纸的对应栏内。

指定网页中, 某个关键词出现的次数除以该网页长度称为该关键词在此网页中的词频。 对新闻类网页, 存在一组公共的关键词。因此, 每个新闻网页都存在一组词频, 称为该新闻网页的特征向量。

设两个新闻网页的特征向量分别为: 甲(a1,a2,…,ak)、乙(b1,b2,... ,bk),则计算这两个网页的相似度时需要先计算它们的内积S=a1b1+a2b2+…+akbk。一般情况下,新同网页特征向量的维数是巨大的, 但每个特征向量中非零元素却并不多。 为了节省存储空间和计算时间,我们依次用特征向量中非零元素的序号及相应的词频值来简化特征向量。为此,我们用(NA(i),A(i)|i=1,2,...,m)和(NB(j),B(j)|j=1,2,...,n)来简化两个网页的特征向量。 其中:NA(i)从前到后描述了特征向量甲中非零元素A(i)的序号(NA(1)
下面的流程图描述了计算这两个特征向量内积S的过程。

【问题:1.1】
2014年 上半年 下午试卷 案例
正确答案:
你的答案:
请先在App中激活(应用市场搜“软考真题”)
知识点:
试卷:
2014年 上半年 下午试卷 案例

笔记

答题卡
加油
纠错
得分:0